一文拆解英伟达RubinCPX:首颗专用AI推理的芯片到底强在哪?
近期,英伟达发布了其新一代 Rubin CPX,一款专为海量上下文处理的 GPU,能够使 AI 系统能够以突破性的速度和效率处理数百万个令牌的软件编码和生成视频。
英伟达 推理 芯片 cpx 英伟达rubincpx 2025-09-12 19:04 4
近期,英伟达发布了其新一代 Rubin CPX,一款专为海量上下文处理的 GPU,能够使 AI 系统能够以突破性的速度和效率处理数百万个令牌的软件编码和生成视频。
英伟达 推理 芯片 cpx 英伟达rubincpx 2025-09-12 19:04 4
阿里通义实验室近日宣布推出新一代基础模型架构Qwen3-Next,并同步开源基于该架构开发的800亿参数规模模型Qwen3-Next-80B-A3B-Base。该模型采用创新性的参数激活策略,实际运行时仅需激活30亿参数,在保持高效能的同时显著降低计算资源消耗
具体来看,数据贯穿了语料归集、预处理、训练、推理等AI全流程,每个环节都有独特的数据承载需求。这些情况的存在,让传统存储架构与能力已经遭遇瓶颈,催生了一场又一场存储之变。
首先,不得不说,该剧的服化道、置景都很精致。李兰迪在剧中的造型也是美翻了,她跟敖瑞鹏的感情线与剧情浑然天成,在探案中穿插爱情,一点儿也不会让人感到反感。
今天,由 OpenAI 前 CTO Mira Murati 成立于今年 2 月的人工智能初创公司 Thinking Machines Lab,发了第一篇文章 ——《克服 LLM 推理中的不确定性》(Defeating Nondeterminism in LLM
推理 llm llm推理 miramurati miramu 2025-09-12 15:47 9
近年来,强化学习在推动大语言模型进步的过程中扮演着越来越关键的角色,尤其是在提升模型推理能力方面。然而,传统方法在训练过程中常因奖励异常值导致重要性采样比率剧烈波动,进而引发策略更新不稳定、泛化能力受限等问题。为此,微软亚洲研究院提出一种新型稳定化训练算法——
今天凌晨,阿里通义实验室正式发布下一代基础模型架构Qwen3-Next,并训练了基于该架构的Qwen3-Next-80B-A3B-Base模型,该模型拥有800亿个参数仅激活30亿个参数。
今天凌晨,阿里通义实验室正式发布下一代基础模型架构Qwen3-Next,并训练了基于该架构的Qwen3-Next-80B-A3B-Base模型,该模型拥有800亿个参数,仅激活30亿个参数。
在Inclusion·外滩大会现场,阶跃星辰创始人姜大昕表示,模型推理效率是决定AI大规模落地应用的关键要素。而推理效率的提升需要两方面,一是产业上下游联合优化,系统模型co-design。
一家传统软件巨头凭借AI基础设施的惊人爆发,创下三十余年最大单日涨幅,市值逼近万亿美元。甲骨文的狂飙突进,揭示了AI产业竞争的核心命脉——算力之争已进入白热化阶段。
为丰富少年儿童的假期生活,锻炼他们的动手能力、逻辑思维能力和团队协作能力,8月27日,昌图县新时代文明实践中心开展“快乐假期”益智推理《助农小助手》剧本秀活动,带领孩子们在沉浸式互动中完成了一场趣味十足的“农业救援任务”。
今天凌晨2点,阿里巴巴开源了新架构模型Qwen3-Next-80B-A3B,对混合注意力机制、高稀疏性MoE、训练方法等进行了大幅度创新,迎来了自己的DeepSeek时刻。
模型 推理 开源 架构 deepseek时刻 2025-09-12 08:10 10
9月9号,AI圈又被那个男人搅得天翻地覆了。没错,说的就是皮衣刀客,英伟达的创始人兼首席执行官黄仁勋。在AI基础设施峰会(AI Infra Summit)上,老黄面带微笑,云淡风轻地扔出一款名为Rubin CPX的新品类GPU。
9月11日,@于朦胧工作室发讣告:“我们怀着无比沉痛的心情告知大家,我们深爱的朦胧,于2025年9月11日坠楼身故。经警方工作,已排除刑事嫌疑。愿逝者安息,愿生者坚强。”
从ChatGPT到现在的智能体AI这个跨越说明了一个关键转变。ChatGPT本质上是个聊天机器人,生成文本回应;而AI智能体能够自主完成复杂任务——销售、旅行规划、航班预订、找装修师傅、点外卖,这些都在它的能力范围内。
文心X1.1震撼上线,一手实测力压群雄! 三大能力飙升:事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%。在多项基准测试中,整体表现超越DeepSeek R1-0528,部分保持领先,甚至追上了最顶尖的GPT-5、Gemini 2.5 Pro。
在新智元十周年峰会上,昆仑万维董事长兼CEO方汉分享了企业三年四代「天工」的演进故事。从音乐、视频到智能体,昆仑万维在AIGC与AGI浪潮中不断突破,实现了从互联网平台到AI原生公司的转型。昆仑万维凭借全球化布局与持续创新,正在勾勒「破界·融合·共生」的未来愿
美团搜推Agentic System X (AsX)团队 投稿量子位 | 公众号 QbitAILRM通过简单却有效的RLVR范式,培养了强大的CoT推理能力,但伴随而来的冗长的输出内容,不仅显著增加推理开销,还会影响服务的吞吐量,这种消磨用户耐心的现象被称为“
事情是这样的:今天,Thinking Machines开辟了研究博客专栏「Connectionism」(联结主义),发表了第一篇博客文章「Defeating Nondeterminism in LLM Inference」(击败LLM推理中的非确定性)。
在全球科技行业努力应对人工智能应用和数字技术带来的巨大能源消耗之际,微软的研究人员可能已经找到了一个很有希望的解决方案。微软英国剑桥研究院的一个团队与剑桥大学的合作者成功开发了一款新型的模拟光学计算机(Analog Optical Computer, AOC)